AI资讯新闻榜单内容搜索-DeepSeek

DeepSeek V3.1 Base突袭上线！击败Claude 4编程爆表，全网在蹲R2和V4

DeepSeek V3.1新版正式上线，上下文128k，编程实力碾压Claude 4 Opus，成本低至1美元。在昨晚，DeepSeek官方悄然上线了全新的V3.1版本，上下文长度拓展到128k。本次开源的V3.1模型拥有685B参数，支持多种精度格式，从BF16到FP8。

来自主题: AI资讯

6129 点击 2025-08-20 12:56

刚刚DeepSeek发布3.1版本，实测有进步，在编程等个别场景可硬刚GPT-5

没等到Deepseek R2，DeepSeek悄悄更新了V 3.1。官方群放出的消息就提了一点，上下文长度拓展至128K。128K也是GPT-4o这一代模型的处理Token的长度。因此一开始，鲸哥以为从V3升级到V 3.1，以为是不大的升级，鲸哥体验下来还有惊喜。

来自主题: AI资讯

7399 点击 2025-08-20 03:37

AI版华尔街之狼！o3-mini靠「神之押注」狂赚9倍，DeepSeek R1最特立独行

AI能像科幻电影中的先知一样预测未来吗？一个名为「Prophet Arena」的全新基准测试，正通过预测真实世界事件来评估AI的「预言」能力。

来自主题: AI资讯

6031 点击 2025-08-18 19:05

冗长响应缩减80%，DeepSeek GRPO获得颠覆性改进，微软GFPO问世

用过 DeepSeek-R1 等推理模型的人，大概都遇到过这种情况：一个稍微棘手的问题，模型像陷入沉思一样长篇大论地推下去，耗时耗算力，结果却未必靠谱。现在，我们或许有了解决方案。

来自主题: AI技术研报

5224 点击 2025-08-15 11:26

爆出！DeepSeek R2预计8月发布！R2为何一直不发，内部紧急发声

GPT-5刚发布没多久，DeepSeek-R2就快来了，好热闹的8月份！ DeepSeek预计将于8月发布其新一代旗舰模型DeepSeek-R2。

来自主题: AI资讯

6919 点击 2025-08-14 12:32

Agent狂欢下的冷思考：为什么说Data&AI数据基础设施，才是AI时代Infra新范式

年初，DeepSeek 前脚带来模型在推理能力上的大幅提升，Manus 后脚就在全球范围内描绘了一幅通用 Agent 的蓝图。新的范本里，Agent 不再止步于答疑解惑的「镶边」角色，开始变得主动，拆解分析需求、调用工具、执行任务，最终解决问题……

来自主题: AI资讯

5249 点击 2025-08-14 09:40

起猛了，诺基亚用上 DeepSeek 了

这就是我与 HMD 3210 的奇遇记：一台外表是 30 年前诺基亚、内心却住着一个完整大模型的「时光机器」。

来自主题: AI资讯

6670 点击 2025-08-11 11:42

独家｜前首富陈天桥新创公司欲对标DeepSeek 国内AI大牛代季峰加盟

国内著名AI青年科学家，清华大学电子工程系副教授代季峰，近日加盟陈天桥旗下盛大网络，正筹备一家新的AI创业公司。《科创板日报》独家获悉，盛大创始人陈天桥对代季峰领衔的这家新AI创业公司寄予厚望，并明确公司的三大研发重点：AI商业决策智能化、突破算法茧房的内容分发，以及面向老龄化和青年发展的AI服务。

来自主题: AI资讯

6622 点击 2025-08-07 11:24

Token成本下降，订阅费却飞涨，AI公司怎么了？

年初那会儿，DeepSeek 横空出世，AI 圈子跟过年一样热闹。它凭啥这么火？除了开源够意思，五百多万的训练成本也惊艳了不少人。

来自主题: AI资讯

6518 点击 2025-08-06 16:08

GLM-4.5 验证：智谱已完成一轮“洗牌”

2025 年已过半，今年的大模型热度明显下降，关于基础模型的关注大多收敛到了 DeepSeek 与阿里通义上。相比之下，曾一度被标榜为大模型“国产替代”、信创之光的智谱 AI 所受到的关注度明显下降，过往高调的战略打法也渐显低迷。

来自主题: AI资讯

5554 点击 2025-08-04 20:18